home *** CD-ROM | disk | FTP | other *** search
/ Amiga Format CD 24 / Amiga Format AFCD24 (Feb 1998, Issue 108).iso / -in_the_mag- / emulation / amiga / uae-0.6.9i / docs / readme.programmers < prev    next >
Text File  |  1998-01-20  |  16KB  |  310 lines

  1. You can help to make this program better. If you fix bugs or implement new
  2. features, I'd be grateful if you send me patches. For a list of interesting
  3. projects, and for a brief summary on how UAE works, see below.
  4.  
  5. A few guidelines for anyone who wants to help:
  6. - Please contact me first before you implement major new features. Someone 
  7.   else might be doing the same thing already. This has already happened :-(
  8.   Even if no one else is working on this feature, there might be alternative
  9.   and better/easier/more elegant ways to do it.
  10. - If you have more than one Kickstart, try your code with each one.
  11. - Patches are welcome in any form, but diff -u or diff -c output is preferred.
  12.   If I get whole source files, the first thing I do is to run diff on it. You 
  13.   can save me some work here (and make my mailbox smaller).
  14.  
  15. Some possible projects, in order of estimated difficulty:
  16. - Someone running *BSD on a x86 might want to try using X86.S on such a
  17.   system. It's likely that only configure needs to be modified.
  18. - Add gamma correction
  19. - Repair support of the serial interface. Sending data seems to work,
  20.   receiving does not. Maybe this has to be implemented in a completely 
  21.   different way (a serial.device? If you do that, don't do it native. At least
  22.   not all of it. Amiga libraries shouldn't be implemented completely native
  23.   in UAE, the parts which are not speed critical should be Amiga native so
  24.   they can call other 68k code safely).
  25. - Someone with a 68020 data sheet might check whether all opcodes are
  26.   decoded correctly and whether all instructions really do what they are 
  27.   supposed to do (I'm pretty sure it's OK by now, but you never know...).
  28. - Add 2.0 packets to filesys.c
  29. - Multi-thread support is there now, it just needs someone to test it on a SMP
  30.   machine and to fix it so it improves speed instead of slowing the thing 
  31.   down.
  32. - Improve the Kickstart replacement to boot more demos.
  33. - Snapshots as in CPE. Will need to collect all the variables containing
  34.   important information. Fairly easy, but boring. (Use core dumps instead :-)
  35.   _If_ someone attempts this, please be more clever than the various CPC
  36.   emulators and dump state only at one fixed point in the frame, preferrably
  37.   the vsync point.
  38. - Find out why uae.device has to be mounted manually with Kick 1.3.
  39.   The problem seems to be that we don't have a handler for it. I _think_ what
  40.   we need is the seglist of the standard filesystem handler. Problem is,
  41.   DOS hasn't been started when the devices are initialized and so we can't get
  42.   to the DosBase->RootNode->FileHandlerSeg pointer, and then there is the
  43.   confusing matter of BCPL GlobVecs and other weird stuff...
  44. - Some incompatibilities might be fixed with user-modifiable fudge variables
  45.   the same way it's done in various C64 emulators.
  46. - With the new display code, it would probably be easier than before to
  47.   implement ECS resolutions - however, a lot of places rely on the OCS timing
  48.   parameters and display sizes.
  49. - Figure out a diskfile format that supports every possible non-standard
  50.   format.
  51. - Implement 68551 MMU. I have docs now. Not among the most necessary things.
  52.   Should be done like exception 3 handling: add code to genamode in gencpu.c.
  53. - Implement AGA support. Some bits and pieces exist.
  54. - Reimplement Amiga OS. (Well-behaved) Amiga programs could then be made
  55.   to use the X Window System as a "public screen". Of course, not all the
  56.   OS would have to be re-done, only Intuition/GFX/Layers (which is enough).
  57.   [Started, look at gfxlib.c - not usable yet.]
  58. - Find some extremely clever ways to optimize the smart update methods. Some
  59.   ideas:
  60.   a) Always use memcmpy() to check for bitplane differences. If no differences
  61.      are found, see if BPLxDELAY got modified, if so, scroll.
  62.      Problems: 
  63.       * You'd still have to draw a few pixels around the DIW borders. Not very
  64.         hard.
  65.       * Scrolling with memcpy in video memory can be terribly slow (no, I
  66.         shouldn't have bought the cheaper video card with DRAMs)
  67.       * At least every 15 pixels a full update has to be done since the
  68.         bitplane pointers get updated after that. And that's with the slowest
  69.     scrolling - if the playfield scrolls faster, the benefit converges
  70.     against zero.
  71.      You could also do vertical scrolling tests, but similar problems arise - 
  72.      where should one check? One line above/below? What about faster
  73.      scrolling? You could use the bitplane pointers as hints, but with
  74.      double/triple buffering this gets problematic, too.
  75.      On the whole, I don't think it would be worth the effort, even if it
  76.      works very well for a few games.
  77.   b) Well, there is no b). If I thought of something I forgot it while
  78.      writing a).
  79. - Port it to Java and Emacs Lisp
  80. - A formal proof of correctness would be nice.
  81.  
  82.  
  83. Source file layout
  84.  
  85. src/      contains (mostly) machine-independent C code.
  86. include/  contains header files included by C code.
  87. md-*/     CPU and compiler dependent files, linked to machdep by configure
  88. od-*/     operating system dependent files, linked to osdep by configure
  89. td-*/     thread library dependent files, linked to threaddep by configure
  90. sd-*/     Sound code. sd-* is only for sound systems which are not OS specific
  91.           or for which no "od-*" directory exists. Linked to sounddep
  92. targets/  Contains header files which contain some information about which
  93.           options a specific port of UAE understands.
  94.  
  95.  
  96. Coding style
  97.  
  98. As long as your code is hidden in a file buried in md-*/ or od-*/ where I
  99. never have a look at it, you can probably get away with not following these
  100. guidelines. 
  101.  
  102. * Do not include CR characters.
  103. * Do not use GNU C extensions if you can't hide them in a macro or in a
  104.   system-specific file so that an alternative implementation is available
  105.   when GNU C is not used.
  106.   This applies to _all_ OS/CPU/compiler specific details. Basically, nothing
  107.   of that sort should appear in src/*.c (we're a bit away from that goal at
  108.   the moment, but it's getting better).
  109. * Make sure your code does not make assumption about type sizes other than
  110.   the minimum widths allowed by C. If you need specific type sizes, use the
  111.   uae_u32 type and its friends.
  112. * Set up your editor so that tab characters round up to the next position
  113.   where ((cursorx-1) % 8) == 0, i.e. 8 space tabs. Do not use 4 space tabs,
  114.   that makes the code awful to read on other machines and worse to edit.
  115. * Lines can be up to 132 characters wide. Use SVGATextMode for the Linux
  116.   console, or use a windowing system in a high resolution.
  117. * C++ comments are a no-no in C code.
  118. * Indentation - look at some code in custom.c and try to follow it. Don't
  119.   use GNU 2-space-in-weird-places indentation, I find it awful. But _do_
  120.   follow the GNU rules for adding whitespace in expressions, and those for
  121.   breaking up multiple-line if statements.
  122.   Fixed indentation rules almost never make sense - break the rules if that
  123.   makes your code more readable.
  124.   Hint: Get jed from space.mit.edu, /pub/davis. It can indent your code
  125.   automatically. Put the following into your .jedrc, and it will come out
  126.   right:
  127.   C_INDENT        = 4;
  128.   C_BRACE        = 0;
  129.   C_BRA_NEWLINE        = 0;
  130.   C_Colon_Offset    = 1;
  131.   C_CONTINUED_OFFSET    = 4;
  132.  
  133.  
  134. How it works
  135.  
  136. Let's start with the memory emulation. All addressable memory is split into
  137. banks of 64K each. Each bank can define custom routines accessing bytes, 
  138. words, and longwords. All banks that really represent physical memory just 
  139. define these routines to write/read the specified amount of data to a chunk 
  140. of memory. This memory area is organized as an array of uae_u8, which means 
  141. that those parts of the emulator that want to access memory in a linear 
  142. fashion can get a (uae_u8 *) pointer and use it to circumvent the overhead of
  143. the put_*() and get_*() calls. That is done, for example, in the
  144. pfield_doline() function which handles screen refreshes.
  145. Memory banks that represent hardware registers (such as the custom chip bank
  146. at 0xDF0000) can trap reads/writes and take any necessary actions.
  147.  
  148. To provide a good emulation of graphical effects, only one thing is vital:
  149. Copper and playfield emulation have to be kept absolutely synchronous. If the
  150. copper writes to (say) a color register in a specific cycle, the playfield 
  151. hardware needs to use the new information in the next word of data it
  152. processes.
  153. UAE 0.1 used to call routines like do_pfield() and do_copper() each time the
  154. CPU emulator had finished an instruction. That was one of the reasons why it
  155. was so slow. Recent versions try to draw complete scanlines in one piece. This
  156. is possible if the copper does not write to any registers affecting the
  157. display during that scanline. Therefore, drawing the line is deferred until
  158. the last cycle of the line. However, sometimes a register which affects how
  159. the screen will look is modified before the end of the line (think of copper
  160. plasmas). That's what "struct decision thisline_decision" is for. It is
  161. initialized at the start of each line. During the line, whenever a vital
  162. register is changed, one of the decide_*() functions is called and may modify
  163. thisline_decision. There are several independent decisions:
  164.  - which DIW should be used
  165.  - where does data fetch start/stop (or is the line in the border altogether)
  166.  - where should sprites be drawn (note: the same sprite can appear more than
  167.    once on one scanline, see Turrican I world 3 levels 1 and 3 for the best
  168.    example)
  169.  - what are the playfield pointers at the start of DDF. Related, what data do
  170.    they point to.
  171.  - what are the playfield modulos at the end of DDF
  172.  - coppermagic with the colors is remembered for later use
  173.  - so is copper magic with the bitplane delay values. I used to think there
  174.    was no useful application for modifying BPLCON1 while data is being
  175.    displayed, but Sanity demos can make Amiga emulator programmers look real
  176.    old.
  177.  
  178. All of this is remembered while the raster line is processed by the hardware.
  179. After the line (at hsync), all the decisions are made if they weren't made
  180. before. At that point the line can be drawn by playfield_draw_line.
  181. Additionally, all the decisions from the previous displayed frame are saved
  182. and compared with the new ones, since often lines are not modified between
  183. frames. This saves a lot of redrawing work.
  184.  
  185. The CPU emulator no longer has to call all sorts of functions after each
  186. instruction. Instead, it keeps a list of events that are scheduled (timer
  187. interrupts, hsync and vsync events) and their "arrival time". Only the time
  188. for the next event is checked after each CPU instruction. If it's higher than
  189. the current cycle counter, the CPU can continue to execute.
  190.  
  191. Things that can't be supported with the current "decision" model:
  192.   - Changes in lores/hires mode during one line. Dunno whether that was ever
  193.     used in reality.
  194.   - Changes to the bitplane DMA bit during one line. Hardly useful and not
  195.     likely to be used. [but there is at least two programs which do ugly
  196.     things like that, and there are some hacks in UAE that make those programs
  197.     work (Magic 12 Ray of Hope 2 is one of these demos)]
  198.   - Changes in bitplane data during one line. If programs do this kind of
  199.     thing, it's most likely accidental and the program is broken. Can happen
  200.     with programs that use the blitter incorrectly, like all the Andromeda
  201.     demos.
  202.   - others? (fill in if you can think of anything)
  203.  
  204. All in all, it's unlikely that this causes compatibility problems. If it does,
  205. fudge values could be introduced (although that sort of thing gets messy
  206. quickly).
  207.  
  208.  
  209. * Native code vs. 68k code
  210.  
  211. It is possible to call native code from 68k code; autoconf.c has some routines
  212. which make setting up a call trap very easy. However, it is not as easy to
  213. call 68k code from native C code, at least not while Amiga Exec multitasking
  214. is running. You ask why?
  215.  
  216. Amiga process1 calls native function foo
  217. Native function foo calls some 68k function and goes into 68k mode
  218. Amiga context switch happens, process1 is put to sleep and process2 gets run.
  219. Amiga process2 calls native function foo
  220. Native function foo calls some 68k function and goes into 68k mode
  221. Amiga context switch happens, process2 is put to sleep and process1 gets run.
  222. Process 1 completes the 68k function called by foo and returns from 68k mode.
  223.  
  224. There. Now we are in function foo again. When it called the 68k code, process2
  225. was active. Now process1 is active, and the function we called in process2
  226. hasn't completed yet. What a mess.
  227.  
  228. To get around this, you need to do some stack magic. Code to do this exists,
  229. but it must be adapted for each port, since setting up a different stack is
  230. completely non-portable.
  231.  
  232.  
  233. * How multithreading in filesys.c works
  234.  
  235. AmigaOS is nice enough to start one processes for each mounted filesystem. All
  236. of these run in the 68k emulation code, i.e. in the main UAE thread. This is
  237. the reason why multithreading is desirable: if the main UAE thread blocks
  238. waiting for I/O, the CPU emulation can't continue to run. Since the Amiga OS
  239. is capable of multi-tasking, it is possible that other code could run until
  240. the I/O operation is complete. The most important bit of code that can run is
  241. the code that moves the mouse pointer - it's unpleasant if the pointer does
  242. not follow mouse movement during disk/CD accesses.
  243.  
  244. When a packet is received by the filesys.asm code, filesys_handler is called.
  245. This function always runs in the main UAE thread.
  246.  - In the single-threaded case, this function performs the action that was
  247.    requested, then returns 0 to indicate "action completed, reply packet".
  248.    Nothing else is performed.
  249.  - In the multi-threaded case, filesys_handler figures out which unit the
  250.    packet was for and sends the packet to the UAE thread responsible for
  251.    handling this unit. filesys_handler returns 0 to indicate: queue the
  252.    packet. Also, one (at that point unused) field in the packet is set to
  253.    0 to indicate that the action was not completed.
  254.  
  255. The latter case is the interesting one. The thread that got the packet does
  256. the following:
  257.  - perform the action as usual
  258.  - set the "command complete" field in the packet to -1.
  259.  - send a message to the AmigaOS (!) filesystem process. However, it can't do
  260.    that without some effort. We can't call 68k code from the emulator easily.
  261.    So we have to use an Amiga interrupt. The filesystem init code sets up an
  262.    Exec IntServer for the EXTER interrupt, and hsync_handler() checks
  263.    periodically whether the filesystem needs an interrupt and raises one if
  264.    necessary.
  265.    Only one dummy message is used per filesystem unit, which is allocated at
  266.    startup. This means that there must be some locking to prevent the unit
  267.    thread from sending the same message twice to the same port. To determine
  268.    whether the message is free, three counts are kept. "cmds_sent" is
  269.    incremented by the UAE thread whenever it has completed a command.
  270.    "cmds_acked" is set to the same value of cmds_sent at the point that the
  271.    interrupt handler got invoked and decided it must send a message. Finally,
  272.    cmds_complete is set to this value at the time the AmigaOS process receives
  273.    the dummy message. Whenever cmds_acked == cmds_complete, the dummy message
  274.    is free to be sent again.
  275.    
  276. The EXTER interrupt basically walks through the units, looks at the cmds_*
  277. fields and sends the dummy message to the Amiga filesystem process when
  278. possible and necessary.
  279.  
  280. When the Amiga filesystem process receives such a dummy message, it does the
  281. following:
  282.  - increment cmds_complete as described above.
  283.  - walk through the queue of unprocessed commands and see which ones now have
  284.    a status of -1, indicating that they are finished. These are removed from
  285.    the queue and replied to.
  286.  
  287.  
  288. * Calltraps at fixed locations
  289.  
  290. F0FF00: return from 68k mode.
  291. F0FF10: must have gotten lost somewhere ;)
  292. F0FF20: used by filesys.c to store away some information from the startup
  293.         packet.
  294. F0FF30: filesys_handler().
  295. F0FF40: startup_handler(), handles only the startup packet for each
  296.         filesystem.
  297. F0FF50: used by the EXTER interrupt which we set up for the filesystem.
  298. F0FF60: used by the uaectrl/uae-control programs (see uaelib.c)
  299. F0FF70: used by the task that gets set up for the mouse emulation.
  300.  
  301. * How the compiler works
  302.  
  303. .. yet to be written. To be decided, in fact.
  304.  
  305.  
  306. Portability
  307.  
  308. This section was out of date. I'll rewrite it.
  309. Some day.
  310.